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Verfafcren und Anordnung *ur leistungsef fizienten Steuerung 
von prozessoren 

ZusammenfaSSuag 

Die- Erf indung betrif ft ein Verfahren zur funktionalen Steuerung 
des Programm- und/oder Datenflusses in digitalen Signalpro- 
, esS oren und Prozessoren mit jeweils abgescnlossenen und von- 
einander getrennten Modulen zur Program- und zur Datenf luss- 
kontrolle, die in parallelen Rechenwerken arbeiten. 

Die erfindungsgemafie AufgabensteUung, eine leistungsef £ iziente 
individuelle Anpassung der Signalverarbeitung bei.der angewand- 
ten Befehlsart SIMD in den einzelnen Datenpfaden zu realisieren 
und das Aufkorcmen an NOP-Bef enlen, mit denen die VLIW- 
^chitektur dea Pressors- versorgt werden muss, zu Kdnimxeren, 
geschieht dadurch, dass infolge der von der PCU umges.tzten 
gXMD Befehle die parallele signalverarbeitung des ■ Pressors in 
den Datenpfaden (DP), die jeweils zu eine™ ersten und zwexten 
Slice zugehOren, individuell gesteuert wird. Die geschieht da- 
durch, class ein von einer SSM-Registerbahk ausgegebener «*Sin r 
gle-Slice-Halt'-Zustandes die Register-Taktversorgung der Slx- 
ces je nach dem Stand anfallenden signalverarbeitung gescbaltet 
wird.. (Fig.) 
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Verfahxen und toordnW *ur leistungsef f izienten steuerung 
von proasessoren 

Die Erf indung betrifft ein Verfahren zur funktionalen Steuerung 
des Program*- und/oder Datenflusses in digitalen Signalpro- 
zessoren und Prozessoren mi.t jeweils abgeschlosserien und von- 
einander getrenn'ten Modulen zur Program- und zur Datenfluss- 
kontrolle, die in parallels Rechenwerken arbeiten. 

Bei den digitalen .Signal-Prozessbren (DSP) bekommen zunehmend . 
Prozessoren Bedeutung, bei denen ihre Architektur eine Slice- 
Struktur aufweist. Hierbei werden Datenpfade zu Slices zusam- 
mengefasst, wobei in einem ersten Slice eine Signalverarbeitung 
unabhangig'von der in einem zweiten Slice parallel ablaufenden 
Signalverarbeitung abgearbeitet wird. 

Wird in den' parallelen Rechenwerken dieser digitalen Signalpro- 
zessoren in der Befehlsart SIMD gearbeitet, ergibt siqh beim 
. stand der Technik das Problem, dass oftmale die dabei angewen- 
deten Algorithms nicht zur parallelen Signalverarbeitung in 
alien Slices geeignet sind. 

So lassen sich beispielsweise bei der Signalverarbeitung in den 
einzelnen Slices, bedingt durch die jeweils dort angewendeten 
unterschiedlichen Algorithmen, die anfallenden Ergebnisse meist 
nur zu unterschiedlichen Zeitpunkten bzw. nach einer unter- 
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• 

'-.schiedlicliea.Anzahl von-Prozessortakten im jeweiligen Slice be- ... 
reitstellen. 

Das Reslme der mit dan aaderen S«D Slices kcnfomen Beiehlsab- 
5 arbeitung kann entwedar gar nicht Oder. nur mit hoham Aufwand 
durchgesetzt werden. 

pieser erforderlieb hohe Aufwand taut ei^erseits softwaremaBig 

j4 ^ q iirit-o-r.eSCTLLfeO. - 



10 



Dieser erJoraer±icn ™ ™~.™.~ . 

als susatsliche abzuarbeitende Programme, die die unterschred- 
Uchen wartezeiten far. die Slices organisieren an. » die pa- 
rallele Bereitstellung dar Ergebnissa zu realisieren. : 

Anderseits tritt dieser hohe Anrwahd in dar Hardware als starke 
Pressor- und.speicherauslastung an £ . die die 
tu ngsfahigkeit vermindert., Biese varmindamng kann B^durch 
aine Speichererweiterung abgewendet warden, was 3 edoeh erne 
vergrdfiarung des Hardwareaufwandes bedeutet. 

Bei*, stand der Tecbnik erweist as sicb als Nacbtail. dass zur 
nctwendigen Anpassung der Algorithm to die 
bei der signalverarbaitnn,, vorhehmlich in dan Slrces It ibren 
zngehorigen patenpfaden, diasa Slice, und weitere rngehdria . 
vnw-Architektnr des Processors in erheblichem u^fang m.t No 
OEeration-Batahlan (nop) varsorgt werdan miissen. 

Au£ diasa weise wird die leistnngssteigernde E«ekte der Anwen- 
dnng der ' SXMP-Bef ablsart nicht nur unwirksa* gemacbt^ ndarn 
as ist darker hinaus zur Algorithmen-Anpassung zusatslicher 
hardware- und sof twaremaSiger Aufwand notwendxg. 

. Wt bestabt die erfind^sge^ ^^^J^JT- 
leistnngseffisiente individnelle Anpassung dar Srgnalverarber 
tnng bei der angewandtan Befehlsart *» in den e.nze Inen Ba 
tenor aden zu realisieren nnd insbasondere das Aufkoaroen an H OP- 
, B^ilen. -t denan die VbXW-Arcbitektur des Pressors „er- 
sorgt werden muss, zu minimieren. 
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Die erfindungsgemiiSe LOsung der Auf gabenstellung wird dadurcb. 
erreicht, dass dieinfolge der von der PCU umgesetzten Simd- 
Befeble parallels Signalverarbeitung de S Prozessors • in einem 
jeweiligen Datenpfad (DP) eiries ersten W zweiten Slice durcb 
ein von einer SSM-Registerbanj(: je Slice ausgegebenen "Smgle- 
Slice-Halt- -Zustandes individuell gesteuert wird. 
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Hierbei wird die steuernde wirkung des ausgegebenen "Single- 
Slice-BtfLf -BuathDdtee dadurcb erreicbt; das s die fur den ersten 
und zweiten Slice zugeordneten Bits der SSM-Registerban* Ober 
Oie jeweiiig zugeb5rige erste und zweite Gated-Cloclc-zelle dx. 
Register-Taktversorgung schalten. 

Badurcb wird das zugehorige Bingangeregister und/oder ^la- 
tor und/cder Pipeline-Steuerregister nach. dam Stand der rn 
oe » Slice daa ****** anfallandan signalverarbertung 1- 
.schenzeitlich gestoppt. 

Er5t durcn dan wagtail das . ausgegebenen ■Single-Slice-Halt"- 
■ austandas wird diese Function bei einer maetzung emas -at*- 
ren SIMD Befehles freigegeben. 

unabhSnglg vom ausgegebenen .single-Slice-Halt-Zustand blaiban 
Z Register-File-Einheit (RFU) und das ^"^"^ 
tar des Prozessors in Function. Me SS^-Bsgisterbax* der PCU 
ist dabel jederzeit durch die PCO beschreiBbar ■ 

pisse Kfcung zielt darauf ab. dass in dan Slice* der Batenpxade 
das Prozessors antspracnend der Befehlsart parallel » t 

den einzelnen Berechnungen begonnen wird. 

Sbar durcb die untarscbiedlichen Berecnnungsabiauf* erfplgt die 
Beraitstallung-dar Swiscben- und/cder Bndergebmsse 
ces zu unterachiadlichan Zeitpunlcten in den Pipeline 
::iuerragistem„ ^ulatcran bzw. Krgebaiaregistem der zuge- 
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h^rigen Datenpfade. 



Soadt wird riach der Bereitstellung der zwiscben- und/oder End- 
ergebniswerte eine weitere signalverarbeitung in den. zu den 
- 5 einzelnen Slice, zugeb 8 rigen Datenpfadea, die nicnt men, ergeb- 
nistracbcig isc, unterbunden. 

pia signalverarbeibnns wird parallel in alien 
Slices tortgesetzt, wenn begoonen wird, einen wezzeren SIMP 
10 Befehl abzuarbeiten. 

« ln e erg*— der erf indungege^en «"•• £ 

^gabenstaUong bastebt darin. dass die Taktveraorgung «. *- 
^Einneic durcb eine sof twarebedingte —dsauag^ £ 
den. Programmes des Pressors so gesteuert wzrd das da 
dU r=b xeilinstrnktionsworte. die in der 

vorliegen, in dieser ■ anscnlieSend £<ir eine M ebrfa=bverwendung 
an den Funkticnaeinheiten bereitgeatallt werden. . 

piese erfindungsge^e Loaung wird vorteiibaft wirbsa»», falls 
aa aine nocwendige AigcriCb.en-Anpaseong an die 
bei der signalverarbeitung. erforderlicb «*t. dass "*-™~T 
p£ ade bzw. die zugeborige VblW-arcbitektur des 
l-Operation-Befeblan <N0P> Oder abnlicben Befeblen „t bober 
Wieibclrate versorgt warden zfcssen. Bsbei warden durcb dze 
verzdadene.oenerierung vcn gleicben VLXW der »""»^ 
verbraucb reduziert und die Becbenbelastung des Pressors ge 
ling gebalten, so daaa die Becbenleisbung effizient fur dxe 
wichtigen Berecbnungen zur Verfilgung steht. 

Eine vorteilbafte variance der erganzendan Ausfubrung der er- 
findungsge^en LS snng bescebb darin, dass das Genevan von 
w eiteren VILW in der VLW-Einbeic dadurcb unterbrocben «*, 
inde* der PCU ein VLW-^r-Kc-a^o uber eine Vor S *g~ll*xtun» 
35 angeWndigt wird und in. nacbsten T abb ^ 
PCP angelegt wird, wobai nacbfolgend dxe POU mittels emer 
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-VLiw-WAiT-Signalleitung und einer dritten Gated Clock-Zelle 
die Taktversorgung fur die. VLiw-Einheit scnaltet. . • • 

DieseL6sung zielt darauf "ab, dass Dabug-Routinen. bei Software- . 
prufungen realist werden konnen, indem S of tware-Break-Points " 
im Prograimncode ges.etzt und angefahren werden k6nnen ? 

D ie Erfindung- soil nachfolgend anhand eines ^ sf ™ S ^ 
spieles ftir die Ausgabe eines Single-Slice-Halt-Zustandes naher 
eriautext werden. in der zeichnungsf igur liegt ein 
bild des Pressors vor, in dexn die Telle It den -zugeharxgen 
^tionseinbeiten aufgefobrt warden, welcbe die erfmdungsge- 
maSe Losung betreffen. . > 

Mr dan .all, daas die . '^^T^ 

. Z uatande S .wir*t. ist as voraussetzung, dass exn ^Befehl^ 
bar den SIHD-Steuer-Buz 12 van der VMW-Binbeit 2 ausgegeben 
Dieeer einaelne Snro -Be t enl Wat eine ,-hrfacbe Detenver- 
arbeitung in de. jeweiligen Batenpfad 14 da S eraten und z^tan 
Slice 18; 19 aus . 

D1 e Ergebnisze werden in da» zugehdrigen viator . » un- 
terscbiedlicben ZeitpunKten bereitgestellt . ^ « ° » 
jeweile » eraten und awaitan Slice 18, 19 zugeordnetes Bat 
der SSM-Registerbank 13 gesetzt. 



25 



35 



^'.signalbelegung' dieses Bits wird.an dan zu. eraten «*W 
. ten Slice 18: 19 jeweilig zugehorigen Datenpfad 14 uber dn.e 
«J fund/ode, zweite S ated-Clo=*-zeUe 3 , . 4 . z^ t und 
3tauart die signaiverarbeitung ik aratan und zweaten Slice 18^ 
1 Individueil. inde* bei eine* vorliegendem Brgebnia in dieae. 
SXice die^tversorgung » zugeborigen 
Omit auch die signalverarbeltung vmterbunden wrrd. 

eai dan Ansgabe ainaa weiteren SI »-Berenl 

Bus 12, z.B. nacb Bereitstallung. dea latatan in exnem dar Six 
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ces erarbeiteten Ergebnisses, wird das. jeweilige .Bit der SSM- 
• Regis terbank 13 zurtickgesetzt und alle Datenpfade beginnen ■ die , % 
nachste Signalverarbeitung indem sie an ihr en Eingangs register 
die von derRFU 11 bereitgestellten Daten einlesen. ■ 

Wt-wird die Signalverarbeitung in den einzelnen Slices der 
D atenp£ade 14 vorteiibaft an die Erfordernisse parallels Abar- 
beltung der siMD-Befehle angepasst. 
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verfahren und Anordnung zur leistungseffiziente* Steuerung 
von prozessoren 

Bftznaagei ehenliSte 

1 . Prozessor , 

2 VLIW-Einheit (.very-LQ^-instruction-Word) 

3 erste Gated-clock-zelle 

4 . zweite Gated-Clock-zelle 

5 AGU (Address-Generating-Unit) 

6 PCU (Process'-Controlling-Unit) 

7 Taktversorgungsleit\wig • 

20 I • ^t^^e^eit t*t G^d-Clock-Zene) 

10 Register der weiteren verarbeitungseii^eit 

11 rfu <Register-File-Binheit) 

12 SIMD-Steuer-Bus 

25 13 SSM-Registerbank , (Single-Slice-Mode) 

14 Datenpfad ••. 
15' siMD-Datenpfad-Steuerleitung ' 

16 vorsignalleitung 
17. vLiw-WAlT-Signallleitung 1 
30 18 erster Slice 

19 zweiter Slice 

20 dritbe Gated-Clock-Zelle 
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VerfaW und *»°rdnun 3 *ur XeLwags.*^""" " 
von Prozeseoren 

Patentansprtiche 

! varfahren zur rationale* Steuerung des »»S*-~ 
' und/oder Batenflus.es in digitalen si ^^™^^ 
P ™oren nit Jewells abgescblossenen und voider 
gstre nn t sn Module*. zur Program- und zur ^enflusskan 
troile, die in parallels Rechenwerken arbeiten, dadurch 
a^ei^nat, dass infolge der vo^ dar PCD <« umgesetz- 
ten SIMP Befeble die parallele signaXverarbextung das Rro- 
sassors (1) . in einam » arsten und zweiten sixes 
as, • (19. Jewells zuge^rxgen » <"> *"* ^ 

^ einer SSM-Registerban* (13, ausgegebenen -Singla- 
Slice-Half-Zustandas individuall gesteuert wxrd, wobel 
flia St euarnda Wiricung das ausgegebenen ..Single-Slxce- 
• Halt-Zustaudes dadurch erreicht wird, indam axe ft* 3eden 
Slice zugeordnaten Bits der SSM-Reglsterbarfc (X 3 , «- ^ . 
jeweiliga ersta u«d zweite Gated-CloeX-Zelle 3),(« £ 
Bagister-Tafctversotgung schalten und dadureh 3 . 
. st L der anfallenden signalverarbeitung in «- - 3-^ 
ligen Slice zugett*igen BP <«» das zugecrdnete Exngangs 
.agister und/oder ~lator ued/cder PiPelxne- 
Steuerregister in seiner Function £ 
sto ppt wird und diasa Function erst durch dan wegfall das 
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ausgegebenen ■Single-SUga-Halt-Zustandas infolge einer 
JLzung ei»es weiteren SiHD Befebls wiener. 

unabbangig, vom ansgegebenen . . S ingle- S li=e-Halt"- 

^arzugrifferegister dee Pressor* ,1) xn ration . 
ben, and die SSM-Registerbank (131 der ecu (6, «t dabex 
jederzeit durch die PCU beschreibbar . 

Verfabren zur funfctionaXen • Steuexung des Progra»- 
nnd/oder ^atenflnsaes in digitals 

-n .it i swells abgescblossenen und voneinander 

ssr^" ™- - « — 

Sofle. die in parallel Kecben^en » 
gekennzeicbnet, dass die Tafctversorgung fur d.e VLIM 
J^IT^l^ eine aoftwarebedingte znetandaausgabe 
anf H Programs das lessors <« -P 
wird, dass dadurcb TailinstrnKtionsworte die » der KH- 

■ Tinbeit <2, afctuell vorliegen, in dieser anscblie^d rOr 
sine Mehrfachverwendnng an den FunKtionseinhexten berert- 
gas tell t werden. 

Verfabren naob ansprucb 2, ^^»e^, da- 
fl aa Generieren von weiteren VXW in der ^ 
■ aadureb unterbrocben wird. in *. der *CU (6, exn^IW- 
WMT - Kmm ando <&er eine vorsignal.leitung (16. 
wird nndim nacbsten Takt dieses Ko^ando an 
angelegt wird, wobei . naebf olgend die PC« (6, ~«*U «-» 
!^XW-» MT "- S ignalleitung .17, and einer dr.tten . Gated 

■ cIL-Zelle »0) die ^tversergung rib: die VLJW-Exnbert 
(2) schaltet. 
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